前提:我有一堆PPT文件:1.pptx、2.pptx、3.pptx......每个文件中都含有若干张幻灯片,这若干张幻灯片中都有一张含有某个关键词的一页,例如含有”月分析“,(我就是每个月要从每个分公司中提取他们的月分析)
需求:将这些含有关键词的PPTX文件,删除无关的页,只保留含有关键词的页,并替换关键词,防止混乱,最后将这些ppt全部合并。
奏乐,代码上:
import pptx
from pptx import Presentation
import os
import re
#import ALL
def replace_text(text_frame):#该函数实现的是文本替换功能
for paragraph in text_frame.paragraphs:
for run in paragraph.runs:
for tt in TEXT_NEED_REPLACE:
if tt[0] in run.text:
run.text = run.text.replace(tt[0], tt[1])
def process_ppt(filename_open, filename_save,Procices):
prs = Presentation(filename_open)
m=0;
for slide in prs.slides:
for shape in slide.shapes:
if shape.has_text_frame:#判断Shape是否含有文本框
text_frame = shape.text_frame
for paragraph in